如果IT 顧問告訴您備份數據是您的技術團隊做好的最重要的事情之一,您可能會點頭表示同意。但是,如果他們建議您的臟數據在使用之前需要清理呢?像“臟”這樣一個簡單的形容詞可能會讓你停下來,還有一些關于“數據”的其他術語你可能也不認識。
數據是信息時代的命脈。它被觀察、收集、組織和分析,它允許企業競爭利潤和繁榮。它有多種形式,每一種都是獨一無二的,而且通常通過添加一個簡單的描述性詞來生動地命名。因此,我們認為一個簡短的詞匯表是為了幫助您了解一些新的數據流行語以及它們可能如何影響您的業務。
不同類型的數據及其含義
小數據
如果“大數據”是關于強大的機器、龐大的數據庫和復雜的分析,那么它的小兄弟“小數據”是關于人的。小數據采用按比例縮小的數據挖掘方法,依賴于社交媒體之類的東西來獲取重要信息。存檔也更簡單,因為不需要復雜的中央數據倉庫。
慢數據
“慢數據”的概念似乎有點違反直覺,因為處理 1 和 0 意味著事情發生得很快。然而,有些信息實際上獲取得更慢。以極地冰蓋為例,那里的東西確實以冰川的速度移動。由于此類數據不需要頻繁分析,因此適合在安全數據湖中以本機格式備份。
快速數據
我們猜你知道接下來會出現這個流行詞,而且它可能正是你認為的那樣。“快速數據”是指快速發生的數據事件——例如每秒數千次——例如金融代碼或電子傳感器。能夠立即采取行動至關重要,因此必須立即將其存放在穩定、易于訪問的位置。
暗數據
簡而言之,“暗數據”只不過是沒有被使用的日常運營數據。它通常指的是客戶通話記錄、競爭對手的價格波動或網站訪問者趨勢等形式的未經分析的信息。它還可以包括不再可訪問的數據,例如當存儲設備過時時。您的企業可以使用旨在整理數據的軟件將這些冗余、過時或隱藏的數據暴露出來。
臟數據
說到整理,我們終于有了“臟數據”。雖然不像骯臟的舞蹈或骯臟的馬提尼酒那樣具有挑釁性,但它確實有引起焦慮的傾向。但它實際上對你的數據倉庫沒有害處;它只是指在“清理”之前的數據集,例如包含重復、拼寫錯誤或格式錯誤的潛在客戶列表。關鍵是確保在將其投入生產之前對其進行整理。